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经 过 长 时 间 的 快速 发 展 和 转化 ， 关 于 人 工 智能 的 研究 产生 了 长 足 的 发 展 。 基 于 其 
研究 而 产生 的 成 果 被 广泛 的 应 用 到 社会 的 各 个 领域 。 在 这 些 应 用 当中 ， 一些 领 域 如 图 
像 识 别 ， 人 工 智能 的 准确 识别 能 力 甚 至 超过 了 人 类 的 识别 能 力 ， 给 人 们 的 学 习 生活 和 
A 步 带 来 了 很 大 的 便利 和 改观 。 这 其 中 反 向 传播 算法 的 应 用 进一步 推进 了 
人 工 智 能 网 络 的 大 规模 运用 和 快速 发 展 。 


第 1 章 绪论 


1.1 研究 背景 与 意义 


随 着 人 工 智 能 技术 的 发 展 进 步 和 快速 沉淀 ， 近 些 年 来 ， 卷 积 神经 网 络 
(Convolutional Neural Network, CNN) 广 泛 应 用 在 加 速 器 、 解 调 器 、 图 像 分 类 、 图 像 处 
理 、 语 音 识 别 等 方面 ， 尤 其 在 图 像 分 类 方面 表现 出 巨大 的 优势 0 习 。 目 前 ， 卷 积 神经 网 
络 相 关 的 算法 种 类 繁多 ， 而 且 卷 积 神经 网 络 算法 的 特点 就 是 运算 量 巨 大 。 

1.2 研究 现状 


从 一 九 六 二 年 起 ， 对 卷 积 神经 网 络 的 研究 就 一 直 在 进行 着 ，Hubel 和 Wiesel 通过 
对 实验 动物 猫 的 大 脑 中 的 视觉 系统 进行 研究 ， 总 结 出 了 感受 野 CReceptive Fields) 的 
理论 。 一 九 八 零 年 , 日 本 的 物理 学 家 福 岛 邦 肩 首先 给 出 了 一 种 神经 网 络 结构 ， 这 种 神 
经 网 络 包 售 卷 积 层 和 池 化 层 , 而 在 上 世纪 八 十 年 代 左右 他 又 提出 了 一 个 Attention 概念 
和 网 络 。 一 九 九 八 年 ， 在 日 本 物理 学 家 福 岛 邦彦 的 研究 基础 上 ，Yann Lecun 提出 了 
LeNet-5 算法 ， 把 误差 反 向 传播 算法 运用 到 神经 网 络 结构 的 训练 上 ， 就 形成 了 现今 卷 
只 神经 网 络 最 初 的 样子 。 

随 着 人 工 智能 技术 的 不 断 发 展 ， 深 度 学 习 中 的 卷 积 神经 网 络 逐 渐 成 为 领域 的 成 熟 
算法 之 一 。 但 与 此 同时 ， 卷 积 神经 网 络 的 算法 的 计算 复杂 度 也 远 高 于 传统 的 算法 ， 网 
络 的 结构 也 越 来 越 复杂 。 
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由 于 人 工 神经 网 络 具 有 高 度 非 线性 描述 的 特点 ,这 个 特点 导致 了 他 们 被 愈 来 愈 广 
泛 的 研究 和 应 用 ， 在 这 些 研究 和 应 用 当中 主要 的 应 用 领域 就 是 分 类 。 分 类 实现 的 基础 
是 特征 分 类 ， 所 以 要 进行 分 类 就 需要 先 提取 样本 的 特征 。 

在 常见 的 卷 积 神经 网 络 中 ， 通 常 是 由 输入 层 、 卷 积 层 、 池 化 层 、 激 活 层 、 全 连接 
层 ， 按 照 一 定 的 次 序 连接 而 构成 。 卷 积 神经 网 络 的 输入 层 实现 的 是 整个 神经 网 络 的 输 
入 ， 在 本 设计 中 ， 训 练 和 推理 的 数据 为 30*30 像素 的 单 通道 灰 度 图 。 卷 积 神经 网 络 的 
卷 积 层 是 深度 学 习 中 常用 的 一 种 神经 网 络 层 ， 其 主要 功能 是 对 输入 数据 进行 特征 提取 。 
在 卷 积 层 的 内 部 包含 多 个 卷 积 核 ， 每 个 卷 积 核 都 对 应 一 个 权重 系数 和 一 个 偏差 量 。 这 
些 卷 积 核 可 以 有 效 地 捕 提 输 入 数据 中 的 局 部 特征 信息 ， 并 通过 组 合 不 同 的 卷 积 核 来 生 
成 更 高 级 别 的 特征 表示 。 卷 积 神经 网 络 中 的 池 化 层 的 池 化 操作 是 一 种 常用 的 操作 ， 其 
主要 功能 是 对 输入 矩阵 进行 降 维 处 理 。 在 池 化 操作 中 ， 通 过 对 输入 和 矩阵 某 一 位 置 的 相 
邻 区 域 的 总 体 统计 特征 进行 平均 或 最 大 值 的 计算 ， 得 到 该 位 置 的 输出 。 常 见 的 池 化 操 
作 主 要 有 平均 池 化 和 最 大 池 化 。 平 均 池 化 是 将 相 邻 区 域 的 数值 取 平 均值 作为 该 位 置 的 
输出 ， 可 以 有 效 地 降低 数据 的 维度 ， 减 少 模型 的 复杂 度 和 计算 量 。 最 大 池 化 则 是 将 相 
邻 区 域 的 最 大 值 作 为 该 位 置 的 输出 ， 可 以 保留 数据 的 重要 特征 信息 。 简 单 来 说 ， 池 化 
操作 降低 了 特征 图 的 节点 个 数 , 通过 获取 图 像 的 主要 特征 来 减少 整个 卷 积 神经 网 络 的 
规模 ,减少 网 络 的 参数 数量 。 池 化 层 可 以 通过 对 输入 和 矩阵 进行 降 维 处 理 ， 减 少 模 型 的 
复杂 度 和 计算 量 , 同时 也 可 以 保留 数据 的 重要 特征 信息 , 提高 模型 的 准确 性 和 和 鲁 棒 性 。 
由 于 卷 积 操作 也 是 线性 映射 ， 要 想 给 卷 积 神经 网 络 加 入 非 线性 映射 就 需要 加 入 激活 函 
数 , 在 本 研究 中 , 我 们 使 用 Relu 函数 来 作为 卷 积 神经 网 络 的 激活 函数 。 在 图 像 经 过 特 
征 提 取 和 信息 过 滤 之 后 ， 我 们 还 需要 将 提取 到 的 信息 特征 输出 ， 卷 积 神经 网 络 的 全 连 
接 层 实现 的 功能 就 是 将 前 面 多 次 卷 积 得 到 的 抽象 化 特征 进行 整合 ， 最 后 样本 归 一 化 ， 
对 各 个 分 类 进行 概率 输出 。 

2.2 神经 网 络 的 训练 和 推理 实现 


上 文中 提 到 ， 本 设计 使 用 的 训练 和 推理 数据 是 30*30 像素 的 单 通道 灰 度 图 。 由 于 


该 样本 的 数据 量 较 少 ， 因 此 本 设计 采用 了 基于 经 典 卷 积 神经 网 络 LeNet-5 提出 了 一 种 
改进 的 网 络 模型 LeNet-3.3 来 分 析 其 在 一 体 化 实现 方法 中 的 表现 。LeNet-3.3 网 络 采用 
除去 池 化 层 ， 增 加 网 络 复杂 度 与 图 像 的 特征 信息 量 的 方法 ， 以 此 来 研究 复杂 网 络 在 此 
实现 方法 中 的 优势 。LeNet-3.3 的 网 络 模型 如 图 1-1 所 示 ， 该 卷 积 神经 网 络 具 有 六 个 网 
络 层 ， 前 三 层 分 别 为 卷 积 层 ， 输 入 的 数据 是 基于 修改 后 的 MNIST 数据 集 单 通道 的 
30*30 的 像素 特征 图 ， 每 次 经 过 卷 积 操作 后 取消 后 面 的 最 大 池 化 层 ， 借 助 这 种 方法 来 
保留 所 有 的 特征 图 信息 ; 后 面 三 层 是 全 连接 层 , 其 中 的 最 后 一 层 完成 图 像 的 分 类 输出 。 
这 个 卷 积 神经 网 络 使 用 改进 后 的 ReLU 函数 作为 激活 函数 。 最 后 通过 softmax 函数 ， 
对 输出 层 的 输出 进行 归 一 化 处 理 。 
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图 1-1 LeNet-3.3 网 络 模型 

在 整个 卷 积 神经 网 络 训练 和 推理 的 过 程 当中 ， 操 作 系统 可 以 对 网 络 的 学 习 率 和 优 
化 器 的 策略 等 运算 相关 的 参数 进行 动态 的 调整 以 提高 模型 的 收敛 速度 ,进而 去 优化 网 
络 的 训练 模型 在 所 使 用 的 推理 数据 集 上 的 表现 。 操 作 系 统 也 可 以 对 参与 预 训练 网 络 模 
型 的 权 值 文件 进行 读 取 操 作 ， 同 时 把 相关 的 网 络 权 值 数据 导入 到 可 编程 逻辑 内 部 进行 
继续 的 训练 ， 在 网 络 全 是 数据 进行 训练 的 时 候 也 可 以 得 到 生成 的 随机 初试 网 络 全 集 ， 
把 这 些 初 始 权 值 导入 到 可 编程 逻辑 单元 内 即 开始 网 络 的 训练 。 

使 用 C 语言 来 重 现 构 建 神经 网 络 中 的 前 向 传播 模型 和 反 疝 传播 模型 , 这 些 模型 包 
括 卷 积 、 池 化 、 全 连接 以 及 激活 函数 等 模块 。 前 面 提 到 ， 本 设计 采用 的 LeNet-3.3 卷 
只 神经 网 络 的 结构 中 含有 六 个 网 络 层 ， 这 其 中 包含 三 个 卷 积 层 和 三 个 全 连接 层 ， 所 以 
在 进行 神经 网 络 的 加 速 的 时 候 需 要 针对 这 两 个 网 络 层 进行 优化 。 

22.1 卷 积 层 结构 设计 
已 知 卷 积 层 的 前 向 传播 可 以 表示 为 : 


ZL(x y) = Z' (x - a, y + b) *w!(a,b) (2-1) 
22, 


4 


在 此 式 中 ，w'(a,b) 表 示 的 是 第 1 层 卷 积 的 卷 积 核 中 所 对 应 的 坐标 为 (ab) 的 元 素 ， 
z!(X,y) 表 示 的 是 第 1 层 卷 积 输出 对 应 坐标 为 (x,y) 的 元 素 。 式 2-1 是 卷 积 的 前 向 传播 的 
关系 式 。 卷 积 层 前 向 传播 的 算法 实现 如 下 : 

Algorithm 1: Convolution 

w: 数据 宽度 

h: 数据 高 度 

k: 卷 积 核 维 数 

input_matrix: 卷 积 层 输入 数据 
kernel: 卷 积 核 参 数 

out matrix: 卷 积 层 输出 数据 


1.for(int i=0;i<w-k+1;1++) 


2. for(int j=0;j<h-k+1;j++){ 


3: out_matrix[1*(h-k+1)+j]=0; 
4. for(int col=i;col<i+3;col++) 
5; for(int row-j;row«j-3;row--*) 
6. out_matrix[i*(h-k+1)+j]+=input_matrix[col*h+row]*kernel[(col-1)*k+(row-j)]; 
T. } 
己 知 在 第 1+1 层 卷 积 的 输出 误差 求 第 I 层 卷 积 的 输出 误差 公式 为 : 
ó (x, y) E (2-2) 
ðZ! (x, y) 


在 这 个 公式 中 ， 误 差 6!(x,y) 指 的 是 当前 层 未 激活 输出 的 Z'(x,y) 关 于 损失 函数 C 
的 导数 。 在 二 维 卷 积 才 做 中 ， 每 一 层 的 5 误差 都 是 一 个 二 维 矩 阵 。 该 窍 阵 的 值 代表 的 
式 在 第 1 层 坐 标 为 (x,y) 出 的 6 误差 ,根据 函数 求 导 的 链 式 法 则 可 以 推 到 出 来 , 式 2-2 可 
以 表示 为 : 


ac OZ t x y") 
l = " BREA = 
PRS 2, LET ðZ! (x,y) SR) 
已 知 式 2-1 的 卷 积 前 向 传播 公式 和 限制 条 件 十 a=x ，y 十 b=y ， 把 已 知 条 
件 带 入 到 求 导 法 则 的 公式 当中 ， 令 a = a, b' = 一 b， 即 可 得 到 : 
Bs > > B. (x + a' y +b) «w'tt(—a',—b’) (2—4) 


-a -b 


日 以 上 公式 可 知 ， 假 定 已 知 第 1+1 层 的 8 误差 与 第 1+1 层 的 卷 积 核 ， 就 可 求 出 第 
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1 层 的 6 误差 。 并 且 把 式 2-4 和 卷 积 层 的 前 向 传播 公式 2-1 相 比 可 以 推理 出 来 : 第 1 层 
的 6 误差 就 是 第 +1 层 的 5 误差 和 第 1 层 的 卷 积 核 旋转 180” 之 后 的 卷 积 结果 。 
但 是 由 于 需要 考虑 卷 积 操作 中 的 输入 矩阵 和 输出 矩阵 的 大 小 也 就 是 维度 , 假设 卷 
积 核 的 维度 大 小 为 k， 那 么 第 1 层 的 误差 6'(x,y) 的 维度 大 小 就 等 同 于 卷 积 层 输入 矩阵 
2Z! 的 维度 i, 第 1+1 层 误差 6'+1(x,y) 的 维度 就 等 同 卷 积 层 的 输出 矩阵 ZU 的 维度 大 小 
jo 根据 卷 积 的 前 向 传播 公式 可 得 j=i-k+1 ， 因 此 在 网 络 反 向 传播 时 需要 对 第 1+1 层 的 
误差 óUl(xy) 进行 零 值 填充 , 在 其 各 边 填充 (k-1) 使 得 61+1(x,y) 维 度 为 j+2*(k-1)， 
在 此 基础 上 再 进行 卷 积 操作 , 之 后 输出 的 维度 就 是 j+2*(k-1)-k+1=j+k-1=i, 符合 第 1 层 
误差 6!(x,y) 的 矩阵 维度 i 。 
可 以 推导 出 ， 如 果 已 知 第 H 层 卷 积 的 输出 误差 那么 求 第 1 层 卷 积 的 输出 误差 就 
会 需要 分 为 三 步 进行 实现 : 第 一 步 是 将 卷 积 w! 核 旋转 180”; 第 二 步 就 是 将 第 1+1 层 
Ix 2:6 106, y) B 3H 78 (k-1) 的 零 值 ， 最 后 一 步 就 是 使 用 上 述 的 卷 积 算法 
Convolution 进行 运算 。 旋 转 卷 积 核 操 作 实 现 如 下 : 
Algorithm 2: OverturnKernel 
k: 卷 积 核 维 数 
input matrix: 旋转 前 的 卷 积 核 
out matrix: 旋转 后 卷 积 核 


1. for(int i=0;i<k;i++) 


2: for(int j=0;j<k;j++) 
3. output_matrix[(k-1-i)*k+(k-1-j)]=input_matrix[i*k+j]; 
矩阵 零 值 填充 的 算法 实现 如 下 : 
Algorithm 3: Padding 
w: 待 填充 矩阵 的 宽度 
_stride: 填 充 步 长 


1. for(int i=0;i<w+2* stride;i++) 


2: for(int j=0;j<w+2*_stride;j++){ 

3 if((i>=stride)&&(j>=stride)&&(i<_stride+w)&&(j<_stridet+w)) 

4. output_matrix[i*(w+2*stride)+j]=input_matrix[(i-_stride)*w+(j-_stride)]; 
5 else 

6. output_matrix[i*(w+2*_stride)+j]=0; // #80 

7. } 


综 上 ， 如 果 已 知 第 1 层 的 卷 积 输出 结果 的 误差 来 去 求 该 层 的 卷 积 核 产 生 的 误差 也 
可 以 使 用 上 述 的 卷 积 算法 来 实现 。 
2.2.2 全 连接 层 结构 设计 
已 知 全 连接 的 前 向 传播 可 以 表示 为 : 
Z! = Wisata (2-5) 
在 式 2-5 中 ，W' 表 示 的 是 第 | ER ARE XEBEBUEDB PE, ARRES 1 层 的 全 连接 
激活 后 的 列 向 量 输 出 ，2Z! 表 示 的 是 第 1 层 全 连接 激活 操作 前 的 列 向 量 输出 结果 。 全 连 
RIE BE BIE SCN GO FB 
Algorithm 4: MatrixMultiPLy 
h: ”全 连接 输入 向 量 维 数 
h out: 全 连接 输出 向 量 维度 
input_matrix: 全 连接 输入 和 矩阵 
para layer: PERNE 
out_matrix: 全 连接 输出 矩阵 


1. for(int j=0;j<h_out;j++){ 


2. output matrix[j ]-0; 

3. for(int i=0;i<h;i++) 

4. output_matrix[j]+=input_matrix[i]*para_layer[i*h_out+j]; 
5.} 


己 知 第 H 层 全 连接 输出 误差 是 5， 可 以 得 到 第 1 ze A SS 
OC” ðc 06741 


dat az” Dal a 
将 全 连接 的 前 向 传播 式 2-5 THA SAL h 4E BEIR S325 WU] YA: 
ac 1+1)T ac 
dal = (W ) * gg (2 = 7) 


计算 矩阵 的 梯度 的 算法 实现 如 下 : 


续 表 


Algorithm 5: CalculateMatrixGrad 
w: ”全 连接 权重 矩阵 宽度 

h: “全 连接 权重 和 矩阵 高 度 
input_matrix: 全 连接 权重 和 矩阵 
grad: 全 连接 输出 梯度 


out_matrix: 全 连接 输入 梯度 
1. for(int i=0;1<w;i++) { 


2. output_matrix[i]=0;// 清 空 梯度 便于 累加 操作 


3. for(int j=0;j<h;j++) 
4. output matrix[i]+=input matrix[i*h-j]*grad[j]; 
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已 知 第 1 层 的 全 连接 输出 误差 是 29 ,那么 第 1 层 的 全 连接 权 值 矩 阵 的 输出 误差 2 


为 : 
ðC 0C OZ! 
aw! = az ow RUD 
将 全 连接 的 前 向 传播 公式 〈 式 2-50. 带 入 并 且 由 和 矩阵 的 求 导 规 则 可 知 : 
ðC 0C CRT 
T a) (2-9) 


求全 连接 权 值 矩阵 的 输出 误差 的 算法 实现 如 下 : 
Algorithm 6: MatrixBackPropagationMultiPLy 
w: “全 连接 权重 矩阵 宽度 
h: “全 连接 权重 和 矩阵 高 度 
input_matrix: 全 连接 输入 梯度 
grad: 全 连接 输出 梯度 
r grad: 全 连接 权重 矩阵 梯度 


1. for(int i=0;i<w;it++) 


5. for(int j=0:j<h:j++) 
3. r grad[i*h-j]-input matrix[i]*grad[j]; 
对 于 全 连接 层 来 说 ， 这 一 层 的 输入 和 输出 的 特征 图 和 梯度 都 是 以 为 向 量 ， 输 入 和 
出 处 的 特征 图 的 权 值 和 梯度 都 是 二 维 向 量 。 在 实现 全 连接 网 络 模块 的 前 向 传播 时 ， 把 
特征 图 和 权 值 进行 加 权 运 算 之 后 ， 再 通过 激活 函数 进行 激活 就 可 以 得 到 了 全 连接 模块 
的 输出 结果 。 在 实现 神经 网 络 的 全 连接 模型 的 反 向 传播 的 时 候 ， 输 入 的 梯度 经 过 激活 
函数 的 导数 之 后 与 权 值 矩 阵 的 转 置 进行 加 权 运 算 后 就 可 以 得 到 反 向 传播 输出 的 梯度 。 
2.2.3 池 化 层 结构 设计 

神经 网 络 的 池 化 层 位 于 连续 的 卷 积 层 之 间 ， 池 化 层 起 到 的 主要 作用 是 在 神经 网 络 
进行 运算 的 时 候 保留 住 输入 数据 的 主要 特征 同时 尽 可 能 的 减少 网 络 中 的 参数 ， 进 而 减 


少 运算 过 程 中 的 运算 量 ， 防 止 网 络 出 现 过 拟 合 的 现象 同时 进一步 提高 网 络 模型 的 泛 化 
。 其 中 常见 的 池 化 操作 包括 平均 池 化 和 平均 池 化 。 平 均 池 化 指 的 是 将 相 邻 区域 的 
数值 取 平 均值 来 作为 该 位 置 的 输出 。 同 理 ， 最 大 池 化 指 的 是 选取 输入 矩阵 的 最 大 值 来 
作为 该 位 置 的 输出 ， 这 两 种 不 同 的 池 化 策略 起 到 的 作用 也 不 同 ， 其 中 最 大 池 化 有 助 于 
保留 图 像 的 所 有 特征 (包含 边缘 特征 ), 而 平均 池 化 有 利于 保留 图 像 的 背景 特征 。 基于 
两 种 不 同 的 池 化 策略 产生 的 作用 , 我 们 需要 对 数据 集 的 图 像 特征 进行 判断 进而 实现 手 
写 体 数字 的 识别 功能 ， 因 此 我 们 使 用 最 大 池 化 的 池 化 策略 。 
数据 在 前 向 传播 的 时 候 ， 使 用 池 化 核 来 扫描 数据 并 且 选 取 该 区 域 中 的 最 大 值 作为 
该 区 域 的 输出 结果 ,同时 记录 下 该 最 大 值 在 原 数据 中 的 位 置 以 便 实现 后 面 的 反 同 传播 
操作 。 其 中 ， 池 化 层 的 前 向 传播 的 算法 实现 如 下 : 
Algorithm 7: MaxPool2d 
w: ” 池 化 前 数据 宽度 
h:” 池 化 前 数据 高 度 
k: ”池内 核 维 度 
input_matrix: 池 化 前 数据 
output tmatrix: 池 化 后 数据 
locate matrix: 池 化 中 位 置 和 矩阵 


1. for(int i=0;1<w/k;i++) 


for(int j=0;j<h/k;j++) ( 
int max_num=-999; 


for(int col=i*k;col<(i+1)*k;col++) 


2 

3 

4 

5. for(int row=]*k;row<(j+1)*k;row++) 
6 if(input_matrix[col*ht+row]>max_num) { 
7 max_num=input_matrix[col*h+row]; 
8 locate matrix[i*(h/k)*j]7col*h-*row; 
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j 
10. output. matrix[i*(h/k)*j]-max num; 
11. } 
上 文 提 到 ， 最 大 池 化 的 策略 就 是 使 用 扫描 区 域 的 最 大 值 来 作为 该 区 域 的 输出 结 
果 ， 因 此 数据 的 输出 的 梯度 就 是 该 最 大 元 素 的 梯度 ， 其 余 元 素 的 梯度 的 值 为 零 。 在 
损失 梯度 反 向 传播 的 时 候 ， 找 到 对 应 的 位 置 赋值 ， 其 余 的 梯度 的 值 为 零 。 因 此 ， 池 
化 层 的 梯度 反 向 传播 的 算法 实现 如 下 : 


Algorithm 8: MaxPooBackPropagation 
w: ” 池 化 前 数据 宽度 

h: ” 池 化 前 数据 高 度 

k: ”池内 核 维度 

input_matrix: 池 化 后 梯度 

outputmatrix: 池 化 前 梯度 

locate matrix: 池 化 中 位 置 矩 阵 


1. for(int col=0;col<w;col++) 


for(int low=0;low<h;low++) 
output matrix[col*h-ow]-0; 
int current locate; 
for(int i=0;i<w/k;i++) 
for(int j=0:j<h/k;j++) { 
current locate = locate_matrix[i*(h/k)+]; 


output_matrix[current_locate]=input_matrix[i*(h/k)+j]; 
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2.3 小 结 


在 本 章 中 ， 主 要 介绍 了 卷 积 神经 网 的 特点 ， 其 特点 就 是 具有 高 度 的 非 线性 描述 的 
特点 , 基于 该 神经 网 络 的 非 线 性 描述 的 特点 , 目前 有 越 来 越 多 关于 他 们 的 研究 和 分 类 。 
接着 介绍 了 卷 积 神经 网 络 的 常见 模型 ， 在 常见 的 卷 积 神经 网 络 中 ， 通 常 是 由 输入 层 、 
卷 积 层 、 池 化 层 、 激 活 层 、 全 连接 层 ， 按 照 一 定 的 次 序 连 接 而 构成 。 接 着 简单 介绍 了 
卷 积 神经 网 络 的 各 层 实现 的 功能 ， 最 后 完成 样本 概率 的 分 类 输出 。 
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图 2-1 数据 集 上 的 部 分 识别 结 
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第 3 章 结论 


首先 ， 本 设计 仔细 探究 了 卷 积 神经 网 络 在 训练 和 推理 过 程 中 的 数据 流 结构 。 实 验 
结果 表明 ， 对 MNIST 手写 体 数字 验证 集 的 识别 准确 率 为 93.637%， 单 张 图 片 的 训练 
时 长 为 23.2ms， 单 张 图 片 的 推理 时 长 为 4.5lms 通过 使 用 片上 多 处 理 器 系统 得 可 编程 
逻辑 来 实现 卷 积 神经 网 络 的 训练 和 推理 极 大 的 降低 了 神经 网 络 训 练 和 推理 过 程 中 的 
消耗 并 且 显 著 提 高 了 相关 设备 的 资源 利用 率 ， 最 大 程度 上 的 减少 了 处 理 器 的 运算 负载 ， 
平衡 了 算 力 和 灵活 性 。 

卷 积 神经 网 络 在 人 工 智 能 领域 取得 了 巨大 的 成 就 ， 为 了 适应 功 耗 和 成 本 敏感 领域 
的 相关 应 用 ， 基 对 于 该 领域 的 研究 具有 非常 可 观 的 研究 价值 ， 但 是 本 设计 依然 很 多 的 
可 以 改进 的 空间 : 

算法 实现 方面 ， 本 设计 所 使 用 的 卷 积 神经 网 络 模 型 较 小 ， 随 着 应 用 场景 越 来 越 复 
杂 和 使 用 准确 性 的 提高 ， 将 来 的 网 络 模型 还 可 以 朝 着 更 大 的 网 络 模型 发 展 。 
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